蚂蚁百灵开卷模型性价比!长文本推理只要1/10成本,6.1B激活撬动40B性能
蚂蚁百灵团队近日正式开源两款全新混合线性推理模型——Ring-mini-linear-2.0与Ring-flash-linear-2.0。相比前代,这一轮升级在延续高稀疏MoE结构的基础上,引入了混合线性注意力(Linear Attention)机制,专为长文
蚂蚁百灵团队近日正式开源两款全新混合线性推理模型——Ring-mini-linear-2.0与Ring-flash-linear-2.0。相比前代,这一轮升级在延续高稀疏MoE结构的基础上,引入了混合线性注意力(Linear Attention)机制,专为长文
它不止于对语言、图像进行理解,还结合了视觉、语言与动作(VLA),并通过具身推理(Embodied Reasoning)来实现“先思考,再行动”。
模型 谷歌 推理 谷歌deepmind deepmind 2025-09-27 12:47 5
近年来,混合专家模型(Mixture of Experts,MoE)在大型语言模型领域展现出巨大潜力。MoE 架构是一种高效扩展模型规模的新技术,利用了“分而治之”的思想,设计了一系列不同的子网络(称为“专家”),通过门控网络来动态决定当前的输入应该交由哪几个
2025 年,生成式推荐(Generative Recommender,GR)的发展如火如荼,其背后主要的驱动力源自大语言模型(LLM)那诱人的 scaling law 和通用建模能力(general-purpose modeling),将这种能力迁移至搜推广
推理 建模 onepiece shopeeonepiece 2025-09-27 10:33 5
《机智的恋爱》是由爱奇艺、云煜影业、娱丸全域联合出品,丸美独家冠名,万和、优乐美奶茶、明星旅拍官铂爵旅拍行业赞助,高端匠心洗护阿道夫、Free飞玲珑包、幸福调味官太太乐指定赞助的一档恋爱社交推理真人秀节目。节目邀请来自各行各业的单身青年男女入住“恋爱小屋”,真
夸了这么多期王源的高情商和推理小达人,也别忘了他还是一位优秀的歌手。这一次的剧本还是跟推理相关,破解密码其实也跟前几次差不多,王源按照剧本进入房间搜证,剧情需要电脑密码,他拿起地上的喇叭摁下了开关,结果节目组在喇叭里放了《生日快乐歌》。音乐一响,王源几乎是下意
由北京时代光影出品,吴强总导演,曹峻祥、高尔曼、蒋小涵主演的24集青春推理剧《瞧!你这小脾气》近日在江苏无锡开机。当天蒋小涵身着组服出席开机仪式,笑容甜美洋溢青春气息。
还记得《开始推理吧》第三季里,那个让全员陷入逻辑漩涡的“时间循环”案吗?白宇在密室中反复推演同一段监控录像,刘宇宁突然指出背景音里钟表秒针的异常停顿,张凌赫迅速联想到房间温度变化与时间戳的关联,周柯宇则默默在白板上画出了空间动线图——而迪丽热巴和金靖同时喊出:
近来,强化学习范式在语言生成和推理模型领域得到了广泛的应用,其中具有代表性的是DeepSeek提出的GRPO (Group Relative Policy Optimization) [1]算法。GRPO是一种基于群体对比的强化学习算法,专为训练大型生成模型(
截至目前,投机推理(Speculative Decoding)技术已成为大语言模型(LLM)推理加速的“标准动作”,但在多模态大模型(VLM)上的应用却举步维艰,现有方法加速比不到1.5倍,性能提升有限。
这项由华为科技加拿大公司的Mohsen Gholami、Ahmad Rezaei、Yong Zhang、Mohammad Akbari和华为云的Zhou Weimin共同完成的突破性研究发表于2025年9月,论文标题为"Spatial Reasoning wi
9月25日,在零一万物华东数智大会上,零一万物CEO李开复在接受21世纪经济报道记者采访时表示,应用爆发后,推理芯片的需求是未来更具成长潜力的方向。基础模型的竞争仍会持续,但训练的占比在整体数据中心支出中会逐渐下降。
金磊 发自 凹非寺量子位 | 公众号 QbitAI它来了,它来了!新一代旗舰模型Qwen3-Max带着满分成绩,正式地来了——国产大模型首次在AIME25和HMMT这两个数学评测榜单拿下100分!
BigOBench 结果在时间与空间复杂度的预测和生成两类任务上,将 CWM 与 Qwen3-32B(带推理能力)、Qwen3-coder-30B 以及 Gemma-3-27B 进行了对比。在时间复杂度预测与生成的全部指标上,CWM 均超越了基线模型。在空间复
✅18宗真实案件改编,聚焦法医,犯罪悬疑题材,秦岚、李光洁、张宥浩领衔主演,全员演技派,光看预告就期待住了,法医探案剧的魅力,在于通过科学的手段还原真相!
9月24日,2025云栖大会开幕,阿里通义旗舰模型Qwen3-Max重磅亮相,性能超过GPT5、Claude Opus 4等,跻身全球前三。Qwen3-Max包括指令(Instruct)和推理(Thinking)两大版本,其预览版已在 Chatbot Aren
作为陪伴观众十载的推理综艺标杆,《大侦探》系列每一季的动态都牵动着无数粉丝的心。如今《大侦探11》即将于2026年Q1登陆芒果TV的消息传来,不仅何炅、张若昀等核心原班人马确认回归,更以“类型化单元剧”的全新模式突破创作边界,让“综N代”的焕新之路充满想象,未
当人类进行计划时,我们会在脑海中想象不同行动可能带来的结果。当我们推理代码时,我们会在心中模拟其部分执行过程。当前一代的大语言模型在这方面表现不佳,往往难以做到真正的推理和模拟。那么,一个经过显式训练的代码世界模型(Code World Model)是不是能够
当其他品牌智能手机已让人机协作渗透至“一句话点外卖、智能识屏解析”等生活场景时,缺失AI助手的iPhone17系列则令人倍感遗憾。毕竟,对于用户而言,手机助手早已不是“语音指令”的简单工具,而是能秒级调整设置、AI处理文档、个性化交互的智能设备。
这项由沙特阿卜杜拉国王科技大学(KAUST)的Mohammad Zbeeb、Hasan Abed Al Kader Hammoud和Bernard Ghanem领导的开创性研究,发表于2025年9月的arXiv预印本平台。感兴趣的读者可以通过arXiv:250